بررسی و مقایسه روش های انطباق و بهبود پرس وجو برای موتورهای جستجو در محیط وب
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز - دانشکده برق و کامپیوتر
- نویسنده رضا خداپی
- استاد راهنما محمدعلی بالافر ناصر رضوی
- سال انتشار 1393
چکیده
پرس وجوهای مبهم و کوتاه ارسالی به موتور جستجوها، به بازیابی نتایج غیرمرتبط منجر می شود. روش های انطباق پرس وجو سعی می کنند تا پرس وجوها را ابهام زدایی کنند و پرس وجو را با نیازهای اطلاعاتی کاربر منطبق کنند. بسط پرس وجو یکی از روش های انطباق پرس وجو است که سعی دارد کلمات مرتبطی را به پرس¬وجو اضافه کند، که می توان کلمات بسط را به صورت محلی و سراسری انتخاب کرد. بسط پرس وجو معمولا کارایی سامانه های بازیابی اطلاعات را افزایش می¬دهد. بازخورد مرتبط (rf) و بازخورد شبه مرتبط (prf) روش های بسط پرس وجو هستند که به ترتیب از اطلاعات بازخورد کاربر و اسناد رتبه بالا در نتایج اولیه استفاده می کنند تا کلماتی مرتبط را به پرس وجو اضافه کنند. راه کارهای محلی برای بسط پرس وجو، از اسناد رتبه بالای نتایج اولیه در روش بازخورد شبه مرتبط استفاده می کنند، که به بهبود کارایی سامانه ی جستجو کمک می کند. راه کار خوشه بندی لی و کرافت سعی می کند تا از هم پوشانی خوشه های ساخته شده با الگوریتم knn، برای انتخاب اسناد مرتبط استفاده کند. راه کار پیشنهادی ما، از الگوریتم knn برای خوشه بندی اسناد نتایج اولیه استفاده می کند. برای رسیدن به خوشه های بهتر، از شباهت حساس به پرس وجو استفاده کرده¬ایم. اعضای خوشه ها رتبه بندی شده و خوشه ها نسبت به هم رتبه بندی می شوند تا بتوانیم اسناد بهتر را از خوشه های رتبه بالا انتخاب کنیم. اسناد مرتبط انتخاب شده با هم ترکیب می شوند و کلمات بسط از سند ترکیبی با تابع رتبه¬بندی tf-idf انتخاب می شوند. کلمات انتخاب شده به پرس وجو اضافه می شوند تا بازیابی با پرس وجو بسط-داده شده انجام گیرد. برای ارزیابی راه کار ارائه شده از مجموعه داده ی پزشکی med استفاده کرده ایم. نتایج آزمایشات نشان می دهد که راه کار پیشنهادی، کارایی را نسبت به بازیابی پایه vsm و بازخورد شبه مرتبط بهبود می دهد. کارایی با خوشه های ساخته شده با شباهت حساس به پرس وجو نسبت به شباهت مبتنی بر کلمه افزایش پیدا کرده است که نشان از موثر بودن شباهت حساس به پرس وجو در خوشه بندی اسناد نتایج اولیه دارد
منابع مشابه
مقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure
کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...
متن کاملموتورهای جستجو در اینترنت
شاید تاکنون در مورد اینترنت و موتورهای جستجوگر مطالب زیادی شنیده و خوانده باشید. ما در اینجا سعی در معرفی مجدد تعدادی از آنها بصورتی بسیار فشرده و مختصر داریم تا در زمان کمتر بتوانید به اطلاعات مورد نیاز خود برسید. همچنین سعی می کنیم به معرفی تعدادی از سایتهای اطلاعاتی با کاربری بالا بپردازیم.
متن کاملبسط پرس وجو با خوشه بندی اسناد شبه بازخورد با شباهت حساس به پرس وجو
بسط پرسوجو بهعنوان یکی از روشهای انطباق پرسوجو، اثربخشی جستجو را در بازیابی اطلاعات افزایش میدهد. بازخورد شبه مرتبط (PRF) روشی برای بسط پرسوجو است که فرض میکند اسناد رتبه بالا از نتایج اولیه مرتبط به موضوع پرسوجو هستند و کلمات بسط را از این اسناد انتخاب میکند. درحالیکه ممکن است اسناد نامرتبط به پرسوجو در اسناد رتبهبالا وجود داشته باشد. روشهایی برای انتخاب اسناد مرتبط و نادیده گرفتن...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز - دانشکده برق و کامپیوتر
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023